音声情報処理 12
標本化 samplingと量子化 quantization
「アナログ」と「デジタル」を振り返る
analog アナログ
情報分野では,「連続量」に相当
世の中にある⾃然のものは,多くがアナログ連続的
⽔の流れ,雲の動き,波の⾳など
digital デジタル
情報分野では,「離散量」に相当
連続量を離散的 Distributiveに数値化
どのように離散化すればよいのか?
digital デジタルとanalog アナログの変換
AD変換とDA変換
AD変換:アナログをデジタルへ
DA変換:デジタルをアナログへ
連続量の信号⇔離散量の信号
Digitization デジタル化することによって,コンピュータで扱えるようになる
信号の加⼯や処理
信号からのさらなる情報の取得
感情分析や⾳声認識など
AD変換
アナログ信号→離散時間信号→デジタル信号
経由
アナログ信号:連続的な時間に対して,⾳波の連続的な変化量
時間に対し無限
離散時間信号:離散的 Distributiveな時間に対して,⾳波の連続的な変化量
標本化 samplingでできる
デジタル信号:離散的 Distributiveな時間に対して,⾳波の離散的な変化量
量子化 quantization
標本化 sampling
ある時間間隔で信号を抽出,時間領域を離散化
標本化間隔(≒標本化周波数)が重要
標本化間隔($ ⊿t)
信号を取り出す時間間隔
標本化周波数 $ f_s(=1 )Hz)
1秒間に取り出す標本値の個数
⾳楽CD:44,100 Hz
標本化の間隔が短い=標本化周波数が⾼い
→より忠実にアナログな波形を表現可能
量子化 quantization
連続値の振幅を離散値に変換
量⼦ビット数:振幅の解像度
各時刻における信号を何段階のレベルで表現するか
⾳楽CDの量⼦化ビット:16ビット
$ 2^{16}=65,536段階で振幅をセンシング
量⼦化ビット数が⼤きいほど忠実にアナログ信号を捉えられる
量⼦化では誤差も発⽣する
デジタル変換の例
3Hzの波について
標本化周波数:4Hz
量⼦化:2bit
で変換
標本化 sampling
1秒間に4回信号を標本化 sampling
量子化 quantization
22=4段階で表現
AD変換における問題点
標本化周波数
⾼い標本化周波数=⾼⾳質=データ量が多い
標本化周波数が低い
結果的に⾳が低くなる
標本化定理を満たさなければならない
量⼦化ビット数
⾼い量⼦化ビット数=⾼⾳質=データ量が多い
量⼦化誤差によって⾳が歪む
標本化定理:帯域制限
任意の帯域Bで制限された連続信号は(1/2B)の時間間隔で標本化した時間信号を⽤いて再現可能
「帯域で制限」とは
時間信号を,ある⼀定の周波数の帯域までの信号によって表現すること
連続的な波形からサンプリングする頻度を制限
周期は2Bに制限:つまり,プラスマイナスBの幅
そもそも⼈間の可聴域は,20Hz〜20,000Hz
人間にとってのコンテンツ
標本化定理:標本化周波数の条件
アナログ信号に含まれる最⾼周波数がBであればBの2倍以上の標本化周波数で標本化すれば,元の信号を復元できることが保証される
例えば,最⾼周波数=200の場合は,400Hzあれば良い
⼈間の可聴域の最⼤周波数:おおよそ20,000Hz
CDの標本化周波数:44,000Hz (> 2 ×20,000Hz)
最⾼周波数の2倍の周波数(2B):ナイキスト周波数
ナイキスト周波数より低い周波数で標本化するとエイリアシングが発⽣する
波の重なりや折返しが発⽣
エイリアシング
異なる周波数 Frequency 振動数が重なって⾒えてしまう
重なるタイミングで⾒てしまう:低い周波数に⾒える
Digitization デジタル化された場合のデータ量
標本化周波数と量⼦化ビット数がわかれば,データ量が算出可能
44.1kHzで量⼦化16bit
ステレオ録⾳
マイクが右と左
10秒間
441000(標本化周波数) × 16([量子化ビット数) × 10(秒数)× 2(マイク数) = 14,112,000 bit
14,112,000 bit/8 = 1,764,000 Byte = 1.76MByte